自由形式变形模型可以通过在图像上操纵控制点晶格来代表广泛的非刚性变形。但是,由于大量参数,由于适应性景观的复杂性,将自由形式变形模型直接拟合到变形图像以进行变形估计是一项挑战。在本文中,我们根据每个控制点影响的区域相互重叠的事实,将注册任务作为多目标优化问题(MOP)。具体而言,通过将模板图像划分为几个区域并独立测量每个区域的相似性,可以通过使用现成的多目标进化算法(MOEAS)来解决多个目标,并可以通过解决拖把来实现变形估计。此外,图像金字塔与控制点网格细分结合使用了粗到五个策略。具体而言,当前图像级别的优化候选解决方案是由下一个级别继承的,这增加了处理大变形的能力。此外,提出了一个后处理过程,以利用帕累托最佳解决方案生成单个输出。对合成图像和现实世界图像的比较实验显示了我们变形估计方法的有效性和实用性。
translated by 谷歌翻译
In the field of reinforcement learning, because of the high cost and risk of policy training in the real world, policies are trained in a simulation environment and transferred to the corresponding real-world environment. However, the simulation environment does not perfectly mimic the real-world environment, lead to model misspecification. Multiple studies report significant deterioration of policy performance in a real-world environment. In this study, we focus on scenarios involving a simulation environment with uncertainty parameters and the set of their possible values, called the uncertainty parameter set. The aim is to optimize the worst-case performance on the uncertainty parameter set to guarantee the performance in the corresponding real-world environment. To obtain a policy for the optimization, we propose an off-policy actor-critic approach called the Max-Min Twin Delayed Deep Deterministic Policy Gradient algorithm (M2TD3), which solves a max-min optimization problem using a simultaneous gradient ascent descent approach. Experiments in multi-joint dynamics with contact (MuJoCo) environments show that the proposed method exhibited a worst-case performance superior to several baseline approaches.
translated by 谷歌翻译
有一段漫长的历史,努力与我们周围的实体和空间探索音乐元素,例如Musique Concr \'Ete和Ambient Music。在计算机音乐和数字艺术的背景下,还设计了集中在周围物体和物理空间上的互动体验。近年来,随着设备的开发和普及,在扩展现实中设计了越来越多的作品,以创造这种音乐体验。在本文中,我们描述了MR4MR,这是一项声音安装工作,使用户可以在混合现实的背景下体验与周围空间相互作用产生的旋律(MR)。用户使用HoloLens,用户可以撞击周围环境中真实对象的虚拟对象。然后,通过遵循物体发出的声音并使用音乐生成机器学习模型进行随机变化并逐渐改变旋律的声音,用户可以感觉到其环境旋律“转世”。
translated by 谷歌翻译
存储器系统和设备可能用于实现应用于模式识别的储层计算(RC)系统。然而,Memristive RC系统的计算能力取决于交错的因素,例如存储器元素的系统架构和物理属性,其复杂化了系统性能的关键因素。在这里,我们为RC的仿真平台开发了Memristor设备网络的仿真平台,这使得能够测试不同的系统设计以进行性能改进。数值模拟表明,基于Memristor-Network的RC系统可以在三个时间级分类任务中产生与最先进的方法相当的高计算性能。我们证明,通过适当地设置忆阻器的网络结构,非线性和预/后处理可以实现设备到设备可变性的优异和鲁棒计算,这增加了利用不可靠的分量设备的可靠计算的可能性。我们的成果有助于建立椎间盘储层设计指南,以实现节能机械学习硬件。
translated by 谷歌翻译
本文解决了对象识别的问题,给出了一组图像作为输入(例如,多个相机源和视频帧)。基于卷积神经网络(CNN)的框架不会有效地利用这些集合,处理如观察到的模式,而不是捕获基础特征分布,因为它不考虑集合中的图像的方差。为了解决这个问题,我们提出了基于基于CNNS的CNNS作为分类器的NN层,作为分类器的NN层,可以更有效地处理图像,并且可以以端到端的方式训练。图像集由低维输入子空间表示;并且此输入子空间与参考子空间匹配,通过其规范角度的相似性,可解释和易于计算度量。 G-LMSM的关键思想是参考子空间被学习为基层歧管的点,用黎曼随机梯度下降而优化。这种学习是稳定,高效,理论上的接地。我们展示了我们提出的方法在手工形状识别,面部识别和面部情感识别方面的有效性。
translated by 谷歌翻译